#코딩 AI

코딩용 LLM의 새로운 활용법을 실험하는 분 있나요?

현재 코딩에 LLM을 활용하는 방식(프롬프트 입력-대기-검토)이 개발자의 몰입 상태(Flow state)를 지속적으로 방해하여 비효율적이라는 지적이 나왔습니다. 이에 기존의 프롬프트-응답 루프를 벗어난 근본적으로 다른 인터페이스(예: 자동 완성 기반 탭 모델 등)나 스타트업 사례를 공유해 달라는 내용입니다. 이는 AI 코딩 도구가 생산성을 높이는 데 진정한 도구가 되기 위해 풀어야 할 핵심 UX 문제를 다루고 있어 중요합니다.

LLM 코딩 AI 개발자 도구

The Decoder • 34일 전

스노우플레이크 CEO, GLM-5.2 성능은 오피스 4.7 맞먹고 비용은 극히 저렴

스노우플레이크의 실사용 코딩 벤치마크 결과, 중국 AI 모델인 GLM-5.2가 안스로픽의 Opus 4.7과 거의 동등한 문제 해결 능력을 보여주었습니다. 첫 번째 시도의 정확도나 토큰 소비량 등 효율성 측면에서는 Opus가 우세했지만, GLM-5.2의 압도적으로 저렴한 사용 비용은 오픈AI 등 서구 AI 기업들의 높은 기업 가치를 위협하는 강력한 요인으로 작용하고 있습니다.

AI 모델 비용 효율성 벤치마크

Hacker News • 43일 전

일상 코딩, 클로드/GPT 대신 로컬 모델로 교체하신 분?

해커뉴스에서 클로드나 GPT 대신 로컬 AI 모델을 실제 일상 코딩에 적용한 사례를 묻는 질문이 올라왔습니다. 질문자는 단순한 테스트용이 아닌 메인 개발 도구로 완전히 전환한 사용자들의 환경 세팅과 토큰 생성 속도(tok/s) 등 성능 정보를 공유해달라고 요청했습니다. 개발자들의 실무 적용 사례를 통해 상용 API를 대체할 수 있는 오픈소스 모델의 현재 성능과 한계를 파악하는 데 도움이 되는 중요한 스레드입니다.

로컬 모델 코딩 AI 오픈소스

MarkTechPost • 46일 전

문샷 AI, 코딩 성능 21.8% 향상된 김이 K2.7-코드 공개

Moonshot AI가 코딩 특화 에이전트 모델인 Kimi K2.7-Code를 Modified MIT 라이선스로 오픈소스화했습니다. 이 모델은 256K 컨텍스트 윈도우를 지원하며, 추론 시 토큰 사용량을 약 30% 절감하고 핵심 벤치마크에서 21.8%의 성능 향상을 달성했습니다. 개발자들은 현재 Kimi API와 Kimi Code를 통해 이 모델을 활용할 수 있습니다.

코딩 AI 오픈소스 문샷 AI

The Decoder • 49일 전

앤스로픽, 코딩·과학 대폭 향상된 5세대 모델 발표

앤스로픽이 5세대 클로드 모델인 클로드 페이블 5(Claude Fable 5)와 클로드 미토스 5(Claude Mythos 5)를 공개했습니다. 범용 모델인 페이블 5는 코딩, 데이터 분석, 시각 처리 등 대부분의 벤치마크에서 기존 최고 성능 모델들을 뛰어넘는 압도적인 성능을 입증했으며, 보안 및 바이오 분야에 특화된 미토스 5는 신약 설계 및 유전체 연구에서 사람 수준 이상의 자율적 성과를 보여주며 AI의 실질적 업무 자동화 가능성을 입증했습니다.

AI 모델 앤스로픽 클로드

Hacker News • 70일 전

구글 제미나이 3.5, 에이전트 행동 수행 능력 강화

구글 딥마인드가 최신 AI 모델 패밀리인 제미나이 3.5를 공개하며, 첫 모델로 고성능 에이전트 및 코딩 작업에 특화된 3.5 Flash를 출시했습니다. 이번 모델은 기존 대비 4배 빠른 속도를 제공하면서도 복잡한 다단계 에이전트 워크플로와 멀티모달 이해도에서 최고 수준의 성능을 기록하는 것이 핵심입니다. 또한 '안티그래비티(Antigravity)' 플랫폼과 결합하여 개발 및 엔터프라이즈 환경에서 실질적인 업무 자동화 및 문제 해결을 대규모로 수행할 수 있습니다.

제미나이 3.5 에이전트 코딩 AI

The Decoder • 71일 전

커서, 오픈AI·앤스로픽 대적 저렴한 AI 모델 공개

AI 코딩 플랫폼 커서(Cursor)가 자체 모델인 'Composer 2.5'를 공개했습니다. 이 모델은 최고수준인 오픈AI의 GPT-5.5 및 앤스로픽의 Opus 4.7과 맞먹는 벤치마크 성능을 제공하면서도 가격은 턱없이 저렴해 실무 개발자들에게 훌륭한 대안이 될 수 있습니다. 또한, 커서는 스페이스X와 손잡고 처음부터 10배 규모의 연산량을 투입해 훨씬 더 큰 후속 모델을 학습 중인 것으로 전해졌습니다.

커서(Cursor) 코딩 AI 가격 경쟁력

Hacker News • 88일 전

우버, 2026년 AI 예산 단 4개월 만에 전량 소진

우버가 엔지니어들의 압도적인 도입으로 인해 2026년 연간 AI 예산을 단 4개월 만에 모두 소진했습니다. 현재 전체 엔지니어의 95%가 매달 AI 도구를 사용 중이며, 작성되는 코드의 70%가 AI에서 생성될 정도로 도구의 활용도가 폭발적입니다. 이는 개발자 생산성을 위한 AI 도구의 가치가 기존 예산 산정 기준을 뛰어넘을 만큼 매우 높아졌음을 시사합니다.

AI 예산 클로드 코드 우버

r/LocalLLaMA • 93일 전

SWE-bench, 오염으로 사실상 한계 도달

오래전부터 코딩 AI 성능의 표준이었던 벤치마크 SWE-bench Verified가 데이터 오염 문제와 불량 테스트 케이스로 인해 최신 프론티어 모델의 코딩 능력을 더 이상 제대로 측정하지 못한다는 분석이 나왔습니다. 평가 데이터가 모델 학습에 노출되어 실력 향상이 아닌 사전 지식 암기로 점수가 올라가는 문제가 발생하고 있습니다. 이에 따라 업계는 새로운 대체 평가 지표인 SWE-bench Pro 사용을 권장하고 있습니다.

벤치마크 오염 코딩 AI SWE-bench

The Decoder • 96일 전

앤스로픽, 클로드 코드 품질 저하 사과

최근 한 달간 지속된 코딩 에이전트 '클로드 코드(Claude Code)'의 품질 저하 문제에 대해 앤스로픽이 공식 사과 및 원인을 발표했습니다. 회사는 추론 깊이 축소, 캐싱 최적화 버그, 시스템 프롬프트 길이 제한 등 3가지 독립적인 오류를 원인으로 지목하고 이를 모두 해결했습니다. 재발 방지를 위해 내부 테스트를 강화하고, 피해를 입은 모든 구독자의 사용량 한도를 초기화하는 보상 조치를 취했습니다.

앤스로픽 클로드 코드 품질 관리

TechCrunch AI • 98일 전

스페이스X 커서(Cursor) 인수합병(M&A)

스페이스X, 커서(Cursor)와 손잡고 600억 달러 인수 옵션 확보

스페이스X는 차세대 '코딩 및 지식 노동 AI' 개발을 위해 인기 코딩 플랫폼 커서(Cursor)와 파트너십을 체결했습니다. 이 계약에는 올해 하반기 커서를 600억 달러에 인수할 수 있는 옵션과 100억 달러의 작업료 지급 조항이 포함되어 있어 업계에 큰 반향을 일으키고 있습니다. 이는 일론 머스크의 기술 제국 확장과 xAI의 컴퓨팅 파워 결합, 그리고 오픈AI 등과의 코딩 AI 시장 주도권 경쟁을 위해 추진된 전략적 행보로 풀이됩니다.

Hacker News • 98일 전

클로드 코드, 신규 월 20달러 프로 요금제에서 제외

앤스로픽이 AI 코딩 도구인 '클로드 코드(Claude Code)'를 월 20달러 프로(Pro) 요금제 신규 가입자에게서 제외하는 실험을 진행하고 있습니다. 이는 구독 기반 사용량 제한 방식에서 API 토큰 기반 종량제로 전환하려는 비용 절감 및 수익화 정책의 일환으로 풀이됩니다. 기존 프로 및 맥스(Max) 구독자들은 이번 변경 사항의 영향을 받지 않습니다.

Anthropic 클로드 코드 요금제 정책

The Decoder • 103일 전

앤스로픽 클로드 4.7, 코딩 대폭 향상 및 보안 능력 축소

앤스로픽이 자율적 코딩 능력과 이미지 해상도를 대폭 향상한 '클로드 오푸스 4.7'을 출시했습니다. 이 모델은 코딩 벤치마크에서 64.3%를 기록하며 전작 대비 큰 성능 향상을 보여주지만, 악용을 막기 위해 사이버 보안 공격 관련 능력은 의도적으로 축소 및 통제했습니다. 단, 새로운 토크나이저 도입으로 인해 실제 사용 비용이 최대 35% 증가할 수 있어 사용자의 주의가 필요합니다.

앤스로픽 클로드 코딩 AI

MIT Tech Review • 106일 전

AI 인식 격차 스탠퍼드 AI 보고서 코딩 AI

AI에 대한 평가가 극명하게 엇갈리는 이유

스탠퍼드 대학의 연례 AI 보고서는 미국의 압도적인 데이터센터 인프라와 TSMC에 의존하는 공급망의 취약성 등 핵심 통계를 제시합니다. 특히 최근 AI 생태계의 가장 큰 특징은 전문가와 일반 대중 간의 인식 격차가 매우 크다는 점입니다. 코딩 등 기술적 작업에 매일 최신 AI를 사용하는 파워 유저는 기술의 발전에 압도되지만, 일반적인 용도로 무료 버전을 사용하는 대중은 여전히 어리석은 실수를 하는 AI에 실망하는 등 사용 경험의 차이가 극명한 갈림길에 서 있습니다.

The Decoder • 110일 전